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Квазиканоническое кодирование графов Бержа 


Предлагается метод получения квазиканонического кода графа. Такой код имеет существенно 
меньшую длину, чем известные канонический и универсальный коды. На основе предлагаемого 
метода легко строятся алгоритмы кодирования и декодирования с линейной оценкой сложности. 


Мы рассмотрим только одну из самых простых разновидностей графов — графы 
Бержа, т.е. неориентированные графы без петель и кратных ребер, причем ребра 
графов имеют одинаковую длину, равную 1. 

Цели кодирования: 

1. Минимизировать длину кода (и, соответственно, время передачи графа по 
каналу связи). 

2. Обеспечить конфиденциальность (скрытность) передачи. 

3. Облегчить распознавание изоморфизма графов (РИГ) ит.д. 

Итак, пусть задан граф @ =(Х,Е,), где Х — множество вершин, РЁ’. — отображение 


Х в себя (т.е. множество ребер). Как известно, граф может быть представлен матрицей 
смежности А. Для графов рассматриваемого типа она симметрична и может иметь 
только 0 или 1 элементы. Поэтому вместо всей матрицы А можно рассматривать 
только ее верхнюю (4, ) или нижнюю ( А; ) треугольную матрицу. Выпишем элементы 


Аз следующим образом в виде линейного списка. Сначала — первую строку, затем 


подряд — вторую, третью и т.д. Получим так называемый канонический код графа. 
Соответствующее ему число — это шифр графа. Спрашивается: можно ли нетривиально 
и взаимно-однозначно закодировать граф, в том числе и словом меньшей длины, чем 
канонический код. И если да, то какой ценой может быть достигнуто. Иначе говоря, 
какова (вычислительная) сложность, т.е. трудоемкость алгоритмов кодирования и 
декодирования графов? 

Очевидно, что если коды двух графов, заданных соответственно матрицами А и В, 
совпадают, то определяемые ими графы Са и Св изоморфны. Однако если коды 
матриц А и В не совпадают, то это еще не значит, что Сл и Св неизоморфны. Для 
окончательного установления факта изоморфизма надо сравнить код матрицы А с 
кодами всех матриц, изоморфных Х. 

Можно поступить иначе: привести А и В к некоторому стандартному, инвари- 
антному виду и сравнить их коды. 

А не являются ли инвариантами минимальные коды (шифры) матрицы? Быть 
может, если для двух графов Сл и Св такие коды совпадают, то Сл-Св (здесь = — 
изоморфизм). Рассмотрим эту задачу более подробно. Итак, надо найти минимальные 
по длине коды (шифры), соответствующие произвольному графу. 

Задача кодирования графа, в том числе и такого, что получаемый код меньше, 
чем канонический, впервые серьезно исследовалась в [1], [2]. Для этого предпо- 
лагается использовать две процедуры — сжатие графов и универсальное кодирование. 
Для [1] важно определить, сжимаем граф в принципе или нет. Оказалось, что вообще 
говоря, это сделать можно не для любых графов, но есть классы сжимаемых графов. 
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В [2] предполагается и процедура универсального кодирования и декодирования 
графов. Сложность такого кодирования оценивается как О (№), где № — количество 
вершин в графе, число же шагов декодирования не зависит от М. Для достаточно 
больших М длина кода сравнима с №. 

Итак, нас интересуют следующие вопросы. Всегда ли универсальный код короче 
канонического? Не является ли универсальный код тем инвариантом, преобразования 
к которому позволило бы решить задачу распознавания изоморфизма? 

Для ответа на эти вопросы предложенные в [2] методики были доработаны до 
алгоритмов, а сами алгоритмы были проверены на большом числе генерируемых 
случайным образом графов. Обработка результатов показала следующее: 

1. Канонические (а также и универсальные) коды автоморфных графов в об- 
щем случае не совпадают. 

2. Длина канонических кодов всех возможных автоморфных графов оста- 
ется постоянной; его же числовое значение (шифр) тем больше, чем более каче- 
ственно размещен кодируемый граф по критерию минимума суммарной длины 
ребер. Такому размещению соответствует и минимальный код. К примеру, 
обратимся к матрицам А и А’, А-А’.Универсальный код минимальной матрицы А” 
имеет вид: К’ = 01101111110110000111111, а код К графа с матрицы А таков: 
К = 1901111111011001010000001000001000010000. 

3. Минимальной матрице соответствует максимальный шифр (из всех тожде- 
ственных ей матриц). 

Вывод 1. Универсальные коды, по-видимому, могут являться инвариантами ре- 
шения задачи распознавания изоморфизма графов (РИГ), если они строятся для ми- 
нимальных матриц. Для целей РИГ это ничем не лучше канонического кода. 

Другое дело, если использовать универсальный код для сокращения длины 
кода. Такая процедура будет полезной в том случае, если преследуется цель мини- 
мизации времени передачи графа по последовательному каналу связи. 

Можно ли сократить длину кода по сравнению с универсальным в последнем 
случае? Можно, если принять некоторое соглашение, известное лишь источнику и 
приемнику. Одним из таких соглашений может быть следующее: исходный граф 
считается размещенным по периметру окружности. Теперь вместо графа можно 
передать список, являющийся моделью так называемого стандартного графа. В [2] 
описано 5 моделей такого типа. Для примера одна из моделей стандартного графа 
первого типа, задаваемого списком 1, такова: 


1(5, 7) 
2 (3, 6,7, 8) 


3 (2, 6) 
© 4 (5, 6, 8) - Это ПЕрЕСТАНОВКа 


и А=(16823754) 


6 (8,1, 2, 4) 
74,2, 5) 
8 (2, 3, 4, 6) 
Вывод 2. Граф из и вершин можно взаимно-однозначно закодировать списком 
ДЛИНЫ И. 
Вывод 3. Для некоторых перестановок получаемое число-код длиннее самой 


перестановки. Представителем всех и! графов, автоморфных данному, является граф, 
определяемый минимальной матрицей. 
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Вывод 4. Минимальная матрица может считаться инвариантом графа (. 

Итак, всякий граф может быть представлен в виде так называемого канонического 
кода. При отсутствии априорной информации о графе канонический код неизбыточен; 
если же мы имеем дело с графом из класса Х так называемых наследственных 
графов [2], то граф может быть закодирован словом меньшей длины. Двоичный 
код графов из наследственного класса Х имеет длину 2121(х)(1 +Е,), где Е, ><, 
при и >00, й(х) — предельное значение коэффициента сжатия, т.е. отношение длины 


кода, построенного с учетом принадлежности графа классу Х, к длине канони- 
ческого кода. 

Любой непустой наследственный класс имеет более экономное кодирование, 
чем каноническое. В [1] описывается метод такого универсального кодирования. 

Обратим внимание на то, что при универсальном кодировании фактически 
производится привязка графа к узлам двумерной решетки. Для этого кроме п надо 
задаться значениями А, т, р; = [п/р]. Например, для и = 9: К =3, т=3, р = 3. Отметим, 
что кодирование (декодирование) графа можно определить с привязкой его вершин к 
более простому — круговому расположению. 

В [2] предлагается несколько способов формирования такого так называемого 
стандартного расположения графов. 

Обратимся к графу, которому соответствует список (1). 

Определим для пары смежных вершин Г и] понятие расстояние 


г; = та (+и, и) | 
где +и, — число вершин, стоящих между смежными вершинами ги] при счете по 


часовой стрелке; 
—7,; — число вершин, стоящих между смежными вершинами {1 и/ при счете против 


часовой стрелки. 

Заменим в списке И перечень смежных с текущей вершиной, А вершин рас- 
стоянием до А имеет список: 1(-2, —1). Построим по нему аналог канонического кода 
2(0, 3, —2, —1), который назовем квазиканоническим кодом 


3(-2, —0) 

4(0, 1,3) 

5(1,—0) 00. в 50 
И 6(1,2.3.=1) 1 р) 3 4 5 

(2-0 

81:2: 3:1) о о аЕ 


6 й 8 
Здесь точки разделяют слова-коды (строки матрицы). Закодируем слово в 2-бук- 
венном алфавите {0,1}. С учётом этого кодирования указанный выше квазиканониче- 
ский код примет вид: 


0000. 0010, 0011. 0101. 0110, 0111. 1000. 1001, 0011. 1001, 0100. 1001, 1010. 
1 2 3 4 5 6 7 8 


его длина равна 64. 

Для сравнения: стандартный канонический код графа соответствующего (, 
00111000.1111000.101000.10100.0001.001.10.1 его длина 44. 

Как видно, получили код длиннее канонического. 

Однако, такое кодирование избыточно, так как в списке Ч фактически одно и 
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то же ребро представлено и соответственно кодируется дважды как Л ий. 


Закодируем слова в скобках в алфавите {0,1}: 


ЗК 


—2, —1 0000 Преобразуем список Ч 
—0 0001 к безызбыточному виду 
0 0010 
3—1 0011 

| т 
ет в (6, 7) мы 
—2 0 0101 2(3, 6, 7,8) 2(0, Зы: -1) 
01 0110 3(8 ; ЗЕ 
3 ОЙ и = (8) = = 
то 1000 4(5,6,8) 4(0,1,—3) 
12 1001 5(7) 50 
3—1 1010 
п ОИ 6(8) 61) 
21 1100 


—2-1 000 Квазиканонический код для и 

03 001 

—2 010 —2,1. 0,3, —2, —1. —2. 0, 1,-3. 1.1 
О о 1 2 3 4 56 
_3 100 

1 101 


С учетом вышеуказанной таблицы имеем следующий код: 


000. 001,000. 010. 011,100. 101. 101. 
1 р 3 4 5 6 


Его длина 31. Напомним, что для канонического кода она равна 44. Можно 
заметить, что чем более связен и чем ближе к однородному исходный граф, тем 
экономнее кодирование. 

Нетрудно построить алгоритм кодирования К. Его сложность, как видно из его 
построения, равна О( Си). Поскольку все операции в К взаимно-однозначные, то 
легко построить и алгоритм декодирования; его сложность также имеет оценку О(Си). 
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В.1. Кодачигов 

Квазжанон!чне кодування графв Бержа 

Пропонуеться метод отримання кваз1канон!чного коду графа. Такий код мае 1стотно меншу довжину, чим 
вом! канончний 1 унверсальний коди. На основ! пропонованого методу легко будуються алгоритми 
кодування 1 декодування з лною ощнкою складност|. 


И. Кодасзоу 

Опазсапошса! Содшо 07 Вегое?$ Старв$ 

Тре тефо4 1 огдег ю аглуе Фе диазсапотса! со4е оЁ этарй 1$ ргезеп. ТЬ1з соде 1$ ет сапИу зВопег феп Фе 
Кпо\уп сапошса!| ап4 ишуегза| содез. Оп Фе Ъаз15 оЁ Фе ргорозе4 плео4 # 1$ еазу ю сопзёласЕ а1еогИиа8 Кг 
епсоЧтз ап4 десодте ул Ппеаг езитайоп оРсотрехйу. 
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